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机 器 学 习 模 型 实现 对 羞 导 特 质 的 


收集 在 线 教学 平台 上 1306 名 小 学 生 的 作文 、 日 记 及 评论 , 采 
自动 预测 ,构建 小 学 生 闭 性 行为 、 认 知 和 情绪 的 语言 风格 模型 。 研 究 发 现 : (1) 扩 
充 的 心理 词典 适合 分 析 小 学 生 文本 ; (2) 分 别 存在 羞 恢 行为 、 认 知 和 情绪 
且 与 普通 学 生存 在 差异 ; (3) 羞 导 各 维度 在 不 同 分 类 器 上 达到 较 好 的 预测 效果 ， 


j 自 然 语言 处 理 技术 进行 文本 分 析 ， 并 应 用 


问题 的 学 生 其 日 常用 语 既 有 共性 也 有 特性 ， 
其 中 随机 森林 模型 的 整体 表现 相对 


显 的 羞 愤 行 为 表现 出 来 ,大 部 分 内 心 有 强 烈 的 羞 尾 


最 好 。 
xung Atk, 在线 写作 , 心理 词典 , 文本 挖 气 , 语言 风格 模型 
分 类 号 B844 

1 引言 


着 导 是 一 种 普遍 存在 的 主观 体验 ,每 个 人 在 日 
铝 生 活 中 都 会 不 同 程度 地 感受 到 关 导 。 小 学 阶段 是 
羞 层 特 质 形成 的 关键 时 期 , 持续 日 较 高 水 平 的 闫 层 
对 学 生 的 社会 交往 、 人 格 发 展 、 身 心 健康 等 方面 均 
具有 消极 影响 ,因此 ,对 早期 差 层 的 测量 尤为 重要 。 
JEI AEW E EZA AKEREKE, Z 
者 均 存 在 一 定 的 问题 : 被 试 容 易 对 自 陈 量 表 作 假 回 
答 ( 李 亚 红 等 , 2005; WI, KEZ, 2007)， 量 表 法 
也 不 适用 于 长 期 追踪 和 动态 反映 学 生 差 层 的 发 展 。 
WEST FR AE DET MAGE A AETA, (AE 
WE DADE TH 2a DE HS LA TRE d US, 这 些 特征 是 内 隐 
的 , 不 易 被 观察 到 (Leary, 1986). 

基于 个 体 留 下 的 网 络 痕迹 来 预测 人 格 品质 是 
近 些 年 的 研究 热点 (Azucar et al, 2018), 通过 对 个 
体 在 线 数据 的 挖掘 构建 预测 模型 ， 能够 持续 输出 对 
被 试 的 评估 结果 ， 比 如 , 研究 者 基于 被 试 在 微 博 上 
发 布 的 内 容 构建 抑郁 预测 模型 ( 白 翔 天 等 ，2014)， 
从 而 及 时 甄别 博 主 的 自杀 倾向 并 进行 及 时 干预 。 郑 
性 与 焦虑 和 抑郁 一 样 具有 较 高 的 内 隐 性 ， 除 非 有 明 
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认 知 和 情绪 体验 的 个 体 难 以 被 直接 观察 到 , 但 是 他 
们 的 日 常用 语 可 能 与 普通 个 体 存 在 差别 。 小 学 生 的 
作文 及 日 记 中 包含 着 其 日 常 学 习 、 生 活 的 真实 经 历 
和 感受 ， 羞 恢 相 关 事 件 及 体验 也 能 够 被 记录 在 内 。 
因此 , 本 研究 基于 小 学 生 的 在 线 作文 、 日 记 和 评论 ， 
拟 采 用 自然 语言 处 理 以 及 机 器 学 习 技 术 ， FEE 
学 生 的 语言 风格 ， 即 羞 层 学 生日 常用 语 中 的 词汇 使 
用 习惯 和 特点 , 构建 羞 丑 的 语言 风格 模型 ， 并 据 此 
建立 羞 层 特 质 的 自动 预测 模型 ,为 实时 监测 学 生 的 
差 层 状 况 并 进行 干预 提供 可 能 。 
11 ŽREME 

Lewinsky (1941)ig HE h “AEE IX, 将 
其 界定 为 一 种 心理 状态 :个 体 极度 抑制 ， 感 到 自卑 、 
被 忽略 ,对 自己 的 感觉 与 情绪 过 分 敏感 ， 同 时 伴随 
有 许多 常见 的 生理 症状 ， 如 脸红 、 出 汗 、 发 拌 、 说 
话 不 流利 等 ; Zimbardo 5: A(1975)9 iH, AeA 
个 体 不 愿意 接近 他 人 , 或 不 愿意 进入 到 被 他 人 关注 
的 、 难 以 回避 的 情境 中 ,强调 了 “不 愿意 ”的 行为 反 
应 倾向 ; Cheek 和 Buss (1981) AIER 4E JJ TE A s 
交往 的 情境 中 , 个 体 由 于 感觉 到 他 人 在 评价 自己 而 
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POH RGR. FRNA. MO AAG. ERE ML 
可 以 看 出 , BRA TAN. WA, TARE 
应 多 个 维度 的 表现 。 

着 恢 从 儿童 五 、 六 岁 左右 开 始 发 展 ( 张 昌 等 ， 
2012)。 儿 童 期 羞 导 对 青春 期 的 外 倾 性 、 开 放 人 性、 
情绪 稳定 性 (Baardstu et al, 2019 、 人 际 关 系 
(Karevold et al., 2012), 、 内 在 问题 (如 焦虑 、 低 自尊 
等 ) (Caspi et al，1988) 以 及 各 领域 的 适应 问题 
(Rubin et al., 1995) 均 具有 预测 作用 。 郑 导 个 体 往往 
缺乏 足够 的 应 对 策略 ， 倾 向 于 情绪 化 地 应 对 问题 ， 
如 攻击 、 自 我 伤害 等 (Eisenberg et al., 1998; Findlay 
et al., 2009; Kagan, 1997)， 导 致 更 加 严重 的 社会 问 
题 。 然 而 ， 早 期 羞 伟 的 消极 影响 和 测量 尚未 得 到 教 
育 工 作者 的 充分 关注 ， 这 一 方面 是 由 于 闭 丑 的 学 生 
沉默 寡言 ， 符 合 课堂 规范 (Evans，2010),， 通 常 成 为 
老师 眼中 安静 顺从 的 好 学 生 ， 导 致 羞 恢 所 带 来 的 消 
极 影响 难以 被 发 现 ; 另 一 方面 是 由 于 中 国 传统 文化 
鼓励 约束 和 克制 的 态度 或 行为 ， 羞 必 的 相关 表现 在 
某 种 程度 上 被 认为 是 个 体 在 社交 方面 的 成 熟 (Chen， 
2010; Ho, 1986)。 因 此 ,在 我 国文 化 背景 下 ， 对 早期 
FEA Ri. ARMA BE 。 

DISA UA, FES AY TW E 4 4 TT HE 28 TE 
行为 、 认 知 、 人 情绪 、 生 理 四 个 维度 上 的 表现 
(Henderson et al., 2014), ALA AME ARRAMA 
性 行为 上 的 困扰 程度 往往 不 同 (Pilkonis，1977)， 许 
ZARAR E TET 2E PETERE dS, SI ill 
TENT AB, MER A MEE IRE, 这些 个 
IKRA P [a] FEE” (Zimbardo, 1977). 目前 , 25 
TERS EW TT ee AKERA. MAMAR H 
HARB RA Zimbardo (1977) Hill WY rte E t 
K (Stanford Shyness Scale)L4 Cheek fil Buss (1981) 
at till AY Age et Fe (Cheek & Buss Shyness Scale). E] 
AOE AME (2001) 编 制 的 《 国 小 儿童 害 
AER), 例如 ， 孙 源泉 等 人 (2009) 采 用 该 量 表 研究 
震 区 丧 亲 儿童 的 盖 恢 、 创 伤 后 应 激 障 碍 症状 和 心理 
健康 之 间 的 关系 。 自 陈 量 表 能 够 全 面 地 捕捉 关 导 在 
行为 、 认 知 、 情 绪 、 生 理 四 个 维度 上 的 表现 , 但 该 
方法 难以 实现 对 羞 快 特 质 的 重复 测量 和 持续 监测 。 
除 自 陈 量 表 法 外 ,研究 者 还 通过 生理 指标 法 、 行 为 
WEES Ty SRT aE EET IM at, 这 两 种 方法 均 无 法 
全 面 地 测量 善心 各 个 维度 : 生理 指标 法 (例如 心率 ) 
仅 能 捕捉 到 羞 导 的 情绪 及 生理 反应 ， 且 更 适用 于 测 
量 状态 性 关 愤 而 非特 质 性 着 恢 (Brodt & Zimbardo, 
1981; Martin, 1961); ÎTI LEE TE DL Se d] sr A) Ae HE 


HJ frg, EAM EE PI ES RS ae AAAA, H. 
^r Wk de SL ii BY 26 E IT 28 n] fie SEB) AP Vs RS d i 
(Henderson et al, 2014)， 因 此 ,观察 的 结果 不 完全 
可 靠 。 

为 进一步 验证 行为 观察 法 的 实际 有 效 性 ,检验 
教师 的 日 党 观察 是 否 能 够 有 效 测 量 学 生 的 羞 导 水 
OV, 本 研究 选择 华西 小 学 三 年 级 2 班 的 49 名 学 生 作 
为 预 研究 样本 ， 要 求 该 班 学 生 作 答 《 国 小 儿童 害羞 
量 表 》， 作 为 学 生 自 评 数据 。 同 时 ， 要 求 班 主任 从 
“ 害 盖 行为 ”"、“ 害 闭 认 知 ”、“ 害 着 情绪 反应 ”三 个 维 
度 对 该 班 学 生 进 行 7 点 评分 , 作为 教师 评定 数据 。 
结果 显示 ,教师 评分 与 学 生 自 评 之 间 相 关 较 低 。 由 
此 可 见 , 班主 任 的 观察 难以 有 效 地 识别 关 层 学 生 ， 
因此 , 我 们 需要 寻找 更 加 有 效 的 测评 手段 ,捕捉 学 
生 内 隐 的 凑 层 认 知 和 情绪 。 

语言 是 人 们 表达 内 在 的 思想 和 情绪 的 有 效 途 
径 (Tausczik & Pennebaker 2010)， 小 学 生 的 作文 及 
日 记 是 学 生 在 自然 状态 下 的 自我 表达 , 文本 的 内 容 
主要 为 日 常 学 习 、 生 活 的 真实 经 历 ， 羞 导 相 关 事件 
及 体验 也 能 够 被 充分 记录 在 内 。 因 此 ,本 研究 将 探 
索 一 种 全 新 的 善 导 测 量 方 法 ， 即 通过 获取 小 学 生 在 
较 长 时 间 内 的 大 量 作文 及 日 记 文本 , 采用 文本 挖 气 
Jr i vr. Wc A Vs i TAR BY o 
1.2 ”文本 挖掘 预测 心理 特质 

差 导 是 一 种 典型 的 人 格 特质 ， 人 格 与 语言 有 密 
切 的 关系 (Mairesse et al., 2007; Pennebaker & King, 
1999), 尤其 是 与 社交 性 相关 的 特质 (Allport，1937; 
Cattell, 1943; Goldberg, 1982; Norman, 1963)。 对 自 
然 语言 的 分 析 能 够 揭示 该 语言 背景 下 个 体 的 语言 
寺 征 与 心理 特质 之 间 的 关系 ,进而 通过 语言 模式 预 
测 心理 特质 (Yarkoni，2010)， 而 词汇 特征 则 是 个 体 
的 思维 、 感 觉 、 观 点 和 人 格 特质 的 重要 线索 
(Argamon et al., 2005), 

以 往 基于 自然 语言 的 心理 学 研究 受到 文本 数 
据 收 集 的 局 限 , 通常 要 求 被 试 在 实验 室 中 完成 命题 
写作 , 例如 ,描述 个 人 的 过 去 经 历 或 未 来 计划 (Fast 
& Funder, 2008; Hirsh & Peterson, 2009)。 然 而 ， 这 
种 方式 收集 到 的 文本 受 情 境 、 新 近 经 验 等 偶然 因素 
影响 较 大 ， 且 数据 量 较 小 , 不 足以 对 个 体 的 特征 进 
行 稳健 的 估计 。 随 着 社交 媒体 、 在 线 学 习 平台 的 普 
A, 人 研究 者 能 够 收集 到 更 加 开放 、 更 长 时 间 监 度 的 
文本 数据 ， 从 而 提取 出 感 兴趣 的 、 有 意义 的 信息 ， 
揭示 个 体 的 心理 特质 (Darre et al., 1999; Feldman & 
Sanger, 2006)。 剑 桥 心理 测量 中 心 的 研究 团队 基于 
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Facebook 用 户 发 布 的 文本 内 容 , 借助 LIWC 等 词典 
提取 语言 特征 ,预测 用 户 的 大 五 人 格 (Markovikj et 
al., 2013); 微软 研究 团队 基于 Facebook 用户 发 布 的 
文本 内 容 和 大 五 人 格 理论 , 构建 基于 社交 媒体 的 人 
格 预测 系统 (Bachrach et al., 2014); Aung 和 Myint 
(2019) 采 用 LIWC、SPLICE 两 个 词典 的 特征 以 及 用 
户 的 社交 网 络 特征 ,预测 Facebook 用 户 的 大 五 人 
格 ; Marouf 等 人 (2019) 采 用 LIWC 词典 特征 ,应 用 
朴素 贝 叶 斯 、 决 策 树 、 随 机 森林 、 线 性 回归 以 及 支 
持 向 量 机 多 种 分 类 模型 ， 预 测 Facebook 用 户 的 神 
经 质 人 格 。 我 国 研究 者 多 依托 微 博 平 台 对 个 体 的 特 
质 、 心 理 状态 进行 预测 ， 壁 如 , 利用 中 文 版 LIWC 
提取 特征 ,检测 用 户 发 布 的 内 容 中 所 表达 的 心理 状 
SORME 等 , 2016), 识别 对 大 五 人 格 各 维度 具有 
预测 作用 的 词汇 (Gu et al., 2018; Qiu et al., 2017), 
以 及 检测 用 户 的 抑郁 、 焦 虑 以 及 自杀 倾向 (Cheng et 
al., 2017)。 

前 述 研究 显示 出 文本 挖掘 技术 应 用 于 人 格 特 
质 预测 的 有 效 性 ， 为 本 研究 利用 文本 挖掘 技术 预测 
AERE SATIRE. Woh, 监测 抑郁 、 焦 虑 等 
心理 状态 以 及 预测 大 五 人 格 的 研究 也 为 本 研究 提 
供 了 理论 基础 : 一 方面 , 闭 层 内 在 地 表现 为 一 种 社 
交 焦 虑 (Leary，1986)， 而 文本 挖掘 是 检测 焦虑 等 心 
理 状 态 的 理想 工具 ， 相 关 研 究 结果 能 够 为 善 丑 情绪 
的 识别 提供 重要 参考 ; HM, A5 AY HE A 
神经 质 等 人 格 特质 存在 显著 的 相关 (Hofstee et al., 
1992; Jones et al., 2014; Kwiatkowska et al., 2019; 
La Sala et al., 2014; Sato et al., 2018), Py (Hilti EAE 
性 中 表现 为 倾向 于 独处 但 能 够 应 对 必要 的 社交 ， 而 
神经 质 在 羞 慎 中 表现 为 孤独 感 、 低 自尊 以 及 对 可 能 
出 现 的 尴 粹 情境 的 过 度 担忧 (Eysenck, 1969)， 因 此 ， 
大 五 人 格 的 文本 挖掘 结果 有 助 于 更 好 地 理解 和 解 
释 羞 导 个 体 的 文本 特征 , 例如 ,高 外 倾 性 和 高 宜人 
性 的 个 体 倾向 于 使 用 更 多 的 积极 情绪 词 和 社会 历 
程 词 ， 人 称 代 词 “ 我 们 ”与 宜人 性 显著 正 相 关 (Gill et 
al., 2009; Mehl et al., 2006; Nowson, 2006; Oberlander 
& Gill, 2006; Qiu et al., 2012; Yarkoni, 2010)。 

因此 ,本 研究 收集 了 小 学 生 在 线 教 学 平台 “ 教 
客 学 伴 ”(https://www.jiaokee.com/) 上 的 作文 、 日 记 
及 长 评论 作为 文本 数据 集 ， 据 此 对 小 学 生 闫 导 群 体 
进行 自动 识别 ,该 文本 数据 集 具 有 较 长 的 时 间 跨 度 ， 
其 内 容 、 主 题 均 有 较 高 的 自由 度 ， 能 够 充分 反映 小 
学 生 的 日 常 学 习 生 活 。 此 外 , 已 有 研究 发 现存 在 不 
lS AY KE, pon, 一 些 羞 层 个 体 报告 的 消 


极 想 法 较 少 但 回避 反应 明显 , — 26 28 He B) 
焦虑 水 平 很 高 但 几乎 没有 表现 出 行为 困难 ,还 有 一 
些 闭 层 个 体 体验 到 强烈 的 负面 情绪 但 生理 反应 不 
明显 (Henderson et al., 2014). All, KARKAA 
性 的 三 个 维度 分 别 进行 特征 提取 和 模型 构建 ， 比 较 
三 个 维度 的 语言 风格 和 词汇 使 用 特点 ， 同 时 比较 模 
型 在 三 个 维度 上 的 预测 精度 。 


2 研究 过 程 


本 研究 采用 文本 分 析 方 法 来 训练 小 学 生 关 丑 
的 分 类 模型 。 首 先 ， FAVA ER ete, AF 
量 表 分 数 将 被 试 分 为 “ 羞 层 群 体 * 和 “普通 群体 "， 这 
个 过 程 通常 被 叫做 “ 打 标 签 ”， 即 对 被 试 群体 进行 分 
类 ; 其 次 ,收集 被 试 的 在 线 写 作文 本 ， 由 于 文本 是 
非 结构 化 的 ， 计 算 机 无 法 直接 对 其 进行 处 理 与 分 析 ; 
因而 需要 进行 文本 的 向 量化 表征 。 本 研究 旨 在 关注 
小 学 后 羞 愤 的 词汇 特征 ， 即 羞 导 学 生 在 日 常 写 作文 
本 中 的 词汇 使 用 特点 ， 因 此 ， 采 用 基于 心理 词典 提 
取 文 本 特征 的 方法 , 将 每 名 学 生 的 全 部 文本 表征 为 
一 系列 词 频 特 征 。 然 后 ,采用 卡 方 算 法 来 筛选 重要 
特征 。 最 后 ， 采 用 机 器 学 习 算法 ， 基 于 筛选 后 的 特 
TER E/N AE AEE AY TT A 。 
2.1 ”数据 收集 
21.1 量 表 数 据 

在 问卷 星 (https:/www.wjx.cn/) 上 发 布 《 国 小 儿 
BEAR) , 邀请 “ 教 客 学 伴 ” 平 台 上 2~5 年 级 的 
小 学 生 在 线 作答 量 表 ， 共 回收 问卷 2734 份 ， 其 父母 
TERE SAGES. ERP NEAT ON. AE 
DA, AHR A AEHE, FE 29 道 题目 ,， 均 采用 4 
点 计 分 ,“1” 表 示 “ 非 常 符合 ”,“2” 表 示 “ 较 符合 ”,，“3” 
表示 “ 较 不 符合 ”,“4” 表 示 “ 非 常 不 符合 "。 量 表 题 目 
示例 : 闫 导 行 为 “同学 邀请 我 参加 活动 的 时 候 , 我 经 
常 找 借口 拒绝 ” 羞 恢 认 知 *“ 如 果 我 拒绝 了 别人 的 请 
RK, 我 认为 他 们 一 定 会 对 我 产生 不 好 的 看 法 ”。 关 尾 
情绪 “老师 叫 我 回答 问题 的 时 候 ， 不 管 我 会 不 会 ， 
我 都 会 心跳 加 快 或 手心 冒 汗 ”。 

采用 SPSS 23.0 软件 对 量 表 数 据 进行 清理 。 根 
据 学 生 的 作答 用 时 以 及 总 题 量 分 析 ，, DR T HE 
短 (平均 每 题 用 时 小 于 2 秒 )、 全 卷 作答 相同 选项 数 
EAF 70%, 以 及 在 相同 数量 的 正 反 向 题目 上 得 分 
标准 差 小 于 0.4 (说 明 被 试 没有 考察 题目 的 语义 , 无 
论 正 向 或 反 向 题目 均 给 予 了 一 致 的 回答 ) 的 无 效 被 
试 ， 得 到 有 效 问卷 2476 W, 男生 1284 名 ,女生 
1192 名 ; 各 年 级 人 数 分 布 为 : 二 年 级 937 A, 三 年 
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级 1012 A, 四 年 级 449 A, 五 年 级 78 A. 

基于 上 述 2476 名 学 生 数 据 , 采用 Mplus 7.0 软 
件 对 量 表 进 行 验 证 性 因素 分 析 及 修订 。 基 于 修订 后 
ER, 分 别 计算 被 试 在 3 个 维度 上 的 原始 得 分 ， 
个 体 的 量 表 得 分 越 高 表示 其 羞 愤 水 平 越 高 ， 随 后 将 
原始 得 分 转换 成 标准 分 数 。 依据 标 准 分 数 对 个 体 进 
行 分 类 是 一 种 常用 方法 ， 比 如 ， 儿 童 行 为 评估 系统 
(Behavior Assessment System for Children Third 
Version) 将 标准 分 大 于 2 ( 即 原始 得 分 高 于 均值 2 个 
标准 差 以 上 ) 的 个 体 判 为 “存在 严重 问题 ”标准 分 


由 于 低 年 级 在 线 写 作 任务 较 少 。 

学 生 文本 示例 :“ 有 一 次 , 我 在 书法 课 里 , 我 正 
在 和 一 个 朋友 上 课 , 突然 ,老师 说 了 一 句 话 , 说 : 
明天 就 是 书法 竞赛 , 谁 要 参加 ? 我 们 纷纷 议论 , 大 
家 都 异口同声 说 : 不 想 去 。 老 师 想 : 机 会 难得 ， 只 
有 两 个 名 额 ,然后 老师 说 了 出 来 ,我们 又 推 人 出 来 ， 
而 我 静 静 地 坐 在 教室 里 的 一 角 , 认 认 真 真 地 写字 ， 
后 来 ,老师 大 发 雷霆 ， 火 冒 三 丈 地 说 : 大 家 都 回 座 
位 。 我 们 就 坐 好 了 。 老 师 说 这 样 就 让 ,老师 还 没 说 
BR, MANARE TEA, MER RA EA 


大 于 1 小 于 2 (得 分 高 于 均值 1 个 标准 差 到 2 个 标 
准 差 之 间 ) 的 个 体 判 为 “有 风险 ”(Sandoval & 
Echandia, 1994)。 本 研究 将 标准 分 数 大 于 1 的 个 体 
RIA ZRA” (REA 1), 表示 个 体 在 该 维度 上 表 
JU ete, 将 标准 分 数 小 于 等 于 1 的 个 体 划 入 “ 普 
通 组 (标签 为 0), RANT RAY ZEEE IE AS HH i AE 
HE 2E 94H 5 26388 AL IA, 22 TR TTON 281 : 
1026, 2: iA Il 176 : 1131, AEA 217 : 1090. 
2.1.2 文本 数据 

依据 填写 量 表 的 学 生 ID, 收集 学 生 在 “ 教 客 学 
FE” E 2013 年 6 月 至 2018 年 1 月 的 所 有 文本 数据 。 
该 平台 为 语文 教改 背景 下 的 实验 教学 平台 , 语文 老 
师 每 天 上 课 都 会 使 用 该 教学 平台 , 学 生 在 语文 课 上 
经 常 被 要 求 在 平台 上 写作 文 ， 写 作 频 率 很 高 。 除 老 
师 要 求 的 写作 任务 外 , 学 生还 会 写 日 记 、 对 同学 的 
写作 进行 评论 ， 这 部 分 内 容 比 较 少 。 本 研究 将 上 述 
文本 数据 合并 在 一 起 ,共同 作为 文本 数据 来 挖掘 语 
言 特征 。 由 于 小 学 生 的 写作 形式 仅 限 于 记叙 文 ， 写 
作 内 容 也 多 围绕 小 学 生 的 真实 经 历 ,例如 ， 记 人 氢 国 
庆 假 期 的 趣事 、 你 最 好 的 朋友 等 主题 ,因而 合并 后 
的 文本 数据 记录 了 学 生日 常生 活 学 习 的 方方面面 ， 
话题 非常 丰富 ， 能 够 充分 地 反映 出 学 生 的 语言 风格 
和 表达 方式 。 

对 上 述 文 本 数据 进行 清理 , 删 去 引用 文本 (如 
摘抄 等 )、 无 意义 文本 (如 乱码 等 )、 短 文本 (“已 阅 ” 
等 ) 以 及 重复 文本 , 仪 保留 学 生 原 创 的 作文 、 日 志 以 
及 长 评论 。 随后 , 将 同一 ID 的 文本 进行 汇总 ， 殊 除 
文本 总 量 过 低 的 个 体 。 最 后 ,将 量 表 数据 与 文本 数 
据 的 进行 匹配 ， 得 到 有 效 被 试 1306 人 。 卡 方 检验 结 
果 显 示 ， 是 否 能 够 匹配 与 性 别 之 间 的 卡 方 值 不 显著 
(X = 1.19, df=1, p = 0.552)， 即 与 性 别 独立 ; 各 年 级 
学 生 的 文本 数据 缺失 情况 (能 够 匹配 的 人 数 : 不 能 
够 匹配 的 人 数 ): 二 年 级 416 : 521， 三 年 级 614 : 398, 


I, 心 侠 侠 地 跳 个 不 停 , 那 掌声 真 让 我 人 迷 ， 我 都 
说 不 出 来 了 。 老 师 说 : 那 就 xx 去 吧 , 还 有 他 后 面 的 
那个 谁 一 起 去 参加 比赛 。 我 很 紧张 当时 , 然后 就 让 
我 回 家 好 好 练 ， 最 后 就 推选 了 我 , 还 有 我 的 朋友 ， 
那 一 次 真 让 我 难忘 , 我 不 会 忘记 的 。” 
2.2 ”心理 词典 修订 与 特征 提取 

在 文本 分 析 领 域 , 词典 是 指定 义 了 特定 类 别 的 
单词 的 集合 ,包含 词语 归属 的 类 别名 称 以 及 词 列 
表 。 目 前 在 心理 学 领域 应 用 较 广 的 是 上 世纪 90 年 
代 开 发 的 “语言 探索 与 字 词 计数 ”词典 (Linguistic 
Inquiry and Word Count, LIWC) (Pennebaker et al., 
2015), EMA 80 个 词类 , 4 4500 个 字 词 , 已 被 用 
来 研究 人 格 特质 、 注意 指向 、 思 维 方式 、 亲 密 关 系 、 
社会 关系 、 情 绪 与 心理 健康 等 众多 问题 (Tausczik & 
Pennebaker, 2010)。 将 文本 中 的 词语 与 词 虹 进行 一 
一 比 对 , 输出 各 类 词语 的 词 频 结果 ,这 是 一 个 将 文 
本 向 量化 的 过 程 ， 叫 做 特征 提取 (Tausczik & 
Pennebaker, 2010)。 

研究 者 认为 ,基于 词典 的 方法 适用 于 聚焦 特定 
的 研究 问题 或 主题 的 任务 (Guo et al., 2016)。 因 此 ， 
词典 的 适用 性 对 研究 结果 具有 至 关 重 要 的 影响 ,如 
果 词 由 本 身 涵盖 的 词类 不 适 于 进行 目标 构 念 ( 郑 导 ) 
的 分 析 ， 特 征 提取 的 有 效 性 将 会 被 前 弱 。 本 研究 选 
择 中 科 院 心理 所 计算 网 络 心理 实验 室 研 发 的 “ 文 心 
(TextMind)” 中 文 心理 分 析 系 统 ， 该 系统 的 核心 词 
典 (下 称 文 心 词典 ) 参 照 LIWC 开发 , 词 库 分 类 体系 
也 与 LIWC 兼容 一 致 ( 朱 廷 动 , 2016)。 文 心 词典 包含 
102 个 词类 ,超过 一 万 个 词 , 在 心理 学 研究 中 应 用 
广泛 ， 其 有 效 性 得 到 了 充分 的 验证 (Lin et al., 2018; 
Shen et al., 2018; Wan et al., 2019; Xi 等 , 2020)。 
本 研究 基于 小 学 生 着 性 的 语言 特征 ,对 文 心 词典 进 
行 了 扩充 和 改编 :情绪 是 羞 导 特 质 的 重要 表现 指标 ， 
文 心 词典 中 对 情感 历程 词 的 分 类 比较 粗糙 ， 本 研究 


四 年 级 229 : 220, 五 年 级 47 : 31。 这 一 分 布 主要 是 
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的 情绪 词类 别 , 在 文 心 词典 的 正 向 情绪 词 与 负 回 情 
绪 词 下 补充 7 个 二 级 子 类 ,包括 “ 乐 "、“ 好 ”、“ 怒 ”、 
^x. HR, ppc: 将 原 词典 的 “生气 词 ”"、“ 翡 
伤 词 " 与 中 文 情感 词汇 本 体 库 中 的 “人 愤怒”、“ 翡 伤 ” 
合并 为 “ 怒 ”、“ 训 ”两 个 类 别 , 将 原 词 典 的 “焦虑 词 ” 
归 入 “ 慢 ” 这 一 类 别 下 。 此 外 , “动物 词 * 在 小 学 生 文本 
中 的 出 现 频率 较 高 , 将 其 补充 到 词典 中 ; 最 后 ， 删 
去 中 文 分 析 时 不 常用 的 “ 冠 词 * 类 , 分 别 合 并 了 过 
去 、 现 在 、 将 来 时 态 下 的 多 个 子 类 。 修 订 后 的 文 心 
词典 共 包 含 118 个 类 别 。 

此 外 , 文 心 词典 中 的 词汇 贴近 成 人 语言 ， 而 小 
学 生 的 语言 与 成 人 存在 较 大 差异 。 为 保证 词典 适用 
于 提取 小 学 生 文本 特征 ， 本 研究 对 收集 到 的 “ 教 客 
学 伴 * 上 的 小 学 生 文 本 进行 汇总 , 统计 所 有 词汇 的 
词 频 并 由 高 到 低 排序 ， 将 小 学 生 使 用 频率 较 高 但 未 
包含 于 原文 心 词 典 的 词汇 纳入 词典 ， 对 各 词类 下 的 
词汇 进行 扩充 。 

对 每 个 小 学 生 的 全 部 文本 进行 分 词 后 ， 基 于 修 
订 后 的 词典 , 统计 每 个 学 生 的 文本 在 118 个 类 别 上 
的 词汇 频率 ,从 而 生成 118 个 文本 特征 变量 。 
2.3 ”特征 筛选 

采用 文本 分 析 来 预测 人 格 的 相关 研究 大 多 预 
先进 行 特征 筛选 (如 , Tadesse et al., 2018; Tandera et al., 
2017; Yuan et al., 2018)， 挑 选 重要 的 特征 构建 预测 
模型 ， 有 利于 提高 模型 的 计算 效率 和 预测 准确 性 。 
本 研究 不 仅 构建 预测 模型 ， 而 且 着 力 于 识别 羞 导 学 
生 的 日 党 用语 与 普通 学 生 的 差异 从 而 刻画 小 学 生 
aAA US, DU, jx di BE E AX AT 281 
群体 和 普通 群体 的 词汇 进行 分 析 是 一 个 关键 步骤 。 

首先 ， 对 基于 词典 提取 的 118 个 特征 进行 初步 
jx, DRS OPE H ICRP, C1~C98 为 98 
个 词类 , 这 些 词类 之 间 存 在 层级 关系 , 例如， 感知 
历程 词类 别 下 包含 视觉 词 、 听 觉 词 、 感 觉 词 ; 情感 
历程 词类 别 下 包含 正 向 情绪 词 以 及 负 向 情绪 词 。 本 
人 研究 认为 不 同 层级 的 词类 均 有 研究 意义 ， 因 此 
C1~C98 均 作 为 特征 纳入 模型 。C99~C109 为 10 种 
标点 符号 , 本 研究 重点 关注 小 学 生 关 愤 的 词汇 特征 ， 
因此 C99~C109 不 纳入 模型 。C110~C118 为 系统 自 
动 生成 的 统计 特征 ，C110 为 “总 词 数 ”， 由 于 学 生 开 
始 使 用 平台 进行 在 线 写 作 的 时 间 不 同 ,总 词 数 相差 
较 大 ,因此 不 纳入 模型 ， 仅 利用 该 特征 对 C1~C98 
的 词 频 进行 标准 化 ; C111 为 “每 句 平均 词 数 ” 我 们 
认为 这 一 特征 能 够 反映 出 羞 愤 个 体 说 话 长 短 的 语 
言 特征 ,因此 将 该 特征 纳入 模型 ; C112 为 “词典 覆 


盖 率 ”， 即 该 个 体 文 本 用 词 对 整个 词典 的 覆盖 程度 ， 
这 一 特征 无 法 反映 出 羞 丑 群 体 与 普通 群体 具体 在 
哪 一 词类 上 存在 差异 ， 因 此 不 纳入 模型 ; C113“ 数 
字 比 率 ”、C114“ 词 长 等 于 4 的 比率 "、C115“ 词 长 大 
于 4 的 比率 ”、C116“ 英 文 比 率 "”、C118“URL 数量 ”， 
均 与 本 研究 内 容 无 关 ， 且 小 学 生 文 本 中 基本 不 包含 
数字 和 英文 文本 ， 因 此 这 部 分 特征 也 不 纳入 模型 ; 
C117“ 情 感 词 比 率 ” 与 C37“ 情 感 历程 词 ? 对 本 研究 的 
意义 相同 ， 因 此 前 者 不 纳入 模型 。 

然后 , 采用 卡 方 算法 (Oakes et al.，2001) 针 对 
C1~C98 以 及 C111 共计 99 个 词 频 特征 进行 进一步 
的 筛选 ， 识 别 特征 集合 中 能 够 最 大 程度 地 区 分 羞 尾 
群体 与 普通 群体 的 特征 。 卡 方 算法 是 特征 筛选 的 常 
用 算法 (Forman, 2003), 例如 Paudel 等 人 (2018) 通 过 
卡 方 算法 提取 特征 以 实现 对 推 特 用 户 发 布 内 容 的 
情感 分 析 。 卡 方 算 法 在 锁定 文本 中 具有 代表 性 的 关 
键 词 等 方面 具有 很 高 的 有 效 性 ， 通 过 确定 最 小 的 特 
征集 合 , 使 模型 仅 利 用 部 分 重要 特征 达到 理想 的 预 
测 水 平 。 例 如 , Agarwal 等 人 (2011) 对 推 特 文本 进行 
情感 分 类 时 , 使 用 语义 以 及 句子 成 分 等 大 量 文本 特 
征 达 到 75.39% 的 分 类 准确 性 ，Chamansingh 和 
Hosein (2016) 在 此 基础 上 仅 增加 了 卡 方 算法 提取 特 
征 这 一 步骤 ,将 模型 的 分 类 准确 性 提高 至 78.07%, 
并 且 大 大 降低 了 模型 的 计算 时 间 和 内 存 需 求 。 

卡 方 算法 检验 词 频 特征 在 两 个 群体 的 文本 中 
出 现 的 频率 差异 ， 并 且 考 虑 两 类 文本 长 度 的 影响 。 
卡 方 值 越 大 ， 表 示 该 类 词汇 在 两 类 人 和 群 中 的 使 用 频 
率 差异 越 大 。 具 体 计算 公式 为 : 

Y = N(O,,0, -0504 

(Oi1 + O12 (O11 + Oz; (Op + O22 (O5;  O5;) 

其 中 , O11 EAN i Bete] (OW YE AEE REA OCA p 
HY EAS JU, On 表示 Wi 在 普通 群体 文本 中 出 现 的 
频次 ; Oo 表示 除 Wi 外 的 其 它 词 一 Wi) 在 闫 惰 群 体 
文本 中 出 现 的 频次 ,O02, 表示 一 Wi 在 普通 群体 文本 
中 出 现 的 频次 , N 表示 训练 文本 中 所 有 词语 的 频次 
总 和 , N= Oi + On + O21 + Ono 

AND IESE F tt oP EAT . AEE UAW 
性 情绪 三 个 维度 的 得 分 ,分 别 将 小 学 生 分 为 存在 行 
HAE AARRE 8 AE I Ms LR PEM, 
LA x! > 100 (EA REPRE, FEAET, AeA 
FAV Be FENG AR EY) = ZA PIE, CRP TIER 
以 总 词 数 并 标准 化 后 , 纳入 机 器 学 习 预 测 模型 。 
2.4 ”建立 模型 

基于 筛选 后 的 特征 , 采用 机 器 学 习 算 法 构建 文 


160 心 p 


aX ive HAT 


学 R 


第 53 卷 


本 特征 对 羞 导 类 别 的 预测 模型 。 机 器 学 习 算 法 可 以 
构建 高 维 预 测 变量 及 非 线 性 的 预测 模型 。 首 先 ,将 
数据 集 分 为 训练 集 和 测试 集 ， 基 于 训练 集 来 训练 机 
器 学 习 模型 ， 达 到 可 接受 的 预测 效果 后 ,在 测试 集 
中 评估 模型 预测 的 准确 性 。 训 练 集 和 测试 集 的 划分 
比例 见 表 1。 


表 1 训练 集 及 测试 集 划 分 


ET 4i HEY 
样本 数 RAAT HA FAA EAE 
Bo WS 是 5 是 mw 


训练 样本 数 138 9%7 228 — 817 176 869 
测试 样本 数 38 223 53 208 41 220 


模型 评估 指标 为 : 准确 率 、 召 回 率 及 Fl fü. 
结合 表 2 对 各 个 指标 进行 解释 : 准确 率 表 示 被 模型 
分 到 某 类 别 的 个 体 中 , 实际 属于 该 类 的 比例 。 例 如 ， 
模型 在 羞 导 群 体 上 的 准确 率 表 示 被 分 类 为 盖 性 的 
学 生 中 ,实际 也 为 着 愤 ( 标 签 为 1) 的 比例 ,公式 为 
TP/(TP+FP); 模型 在 普通 群体 上 的 准确 率 表 示 被 分 
类 为 普通 的 学 生 中 ,实际 也 为 普通 (标签 为 0) 的 比 
例 ， 公式 为 TN/(FN+TN); 两 个 准确 率 的 均值 代表 
总 准确 率 。 召 回 率 表 示 实 际 属于 某 类 别 的 个 体 中 ， 
被 模型 正确 分 到 该 类 的 比例 。 例 如 ， 模 型 在 盖 尾 群 
体 上 的 召回 率 表示 实际 为 盖 愤 的 学 生 中 ,被 正确 分 
类 为 盖 尾 的 比例 ,这 一 指标 也 被 称 为 “敏感 度 ” D 
现 出 该 工具 将 “阳性 ”个 体检 测 出 来 的 有 效 性 ,公式 
为 TP/(TP+EN); 模型 在 普通 群体 上 的 召回 率 表 示 
实际 为 普通 的 学 生 中 , 被 正确 分 类 为 普通 的 比例 ， 
这 一 指标 也 被 称 为 “特异 度 ”， 体现 出 工具 将 “ 非 阳 
性 ”个 体 拒绝 掉 的 有 效 性 ,公式 为 TN/(FP+TN); 两 
个 召回 率 的 均值 代表 总 召回 率 -Fl 值 为 准确 率 与 召 
回 率 的 调和 平均 数 ， 是 模型 的 综合 指标 ， 善 导 群 体 
的 Fl 值 为 着 导 群 体 的 准确 率 和 召回 率 的 调和 平均 
Be, 普通 群 体 的 FI 值 为 普通 群体 的 准确 率 和 召回 
率 的 调和 平均 数 , 总 Fl 值 为 总 准确 率 和 总 召回 率 
的 调和 平均 数 。 

R2 模型 分 类 结果 及 数据 的 实际 分 布 
SCOR PIER 实际 属于 普通 群体 
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分 类 属于 普通 群体 FN TN 


本 人 研究 使 用 Python 3.6.2 进行 模型 构建 ， 尝 试 
采用 决策 树 (Decision Tree, DT) 、 随 机 森林 (Random 
Forest，RF) 、 支 持 向 量 机 (Support Vector Machine, 
SVM), 、 逻 辑 斯 蒂 克 回归 (Logistics Regression, LR), 


K 近邻 (K-Nearest Neighbor, KNN) 以 及 多 层 感知 机 
(Multi-Layer Perceptron, MLP) 六 种 分 类 模型 ， 上 述 
模型 在 人 格 相关 研究 中 应 用 广泛 并 表现 出 较 高 的 
有 效 性 (Aung & Myint, 2019; Farnadi et al., 2013; 
Majumder et al., 2017; Marouf et al., 2019)。 

本 研究 中 羞 导 群 体 的 比例 远 远 小 于 普通 群体 ， 
这 种 “样本 类 别 分 布 不 均衡 "的 情况 普遍 存在 于 心 
理学 相关 研究 中 ， 对 模型 预测 的 有 效 性 具有 负面 影 
il] (He & Garcia, 2009)。 原 始 的 分 类 需 ， 如 逻辑 斯 人 蒂 
克 回 归 、 决 策 树 和 支持 向 量 机 ， 均 适用 于 均衡 的 数 
据 集 ,在 样本 类 别 分 布 不 均衡 问题 上 表现 不 佳 
(López et aL, 2013)。 研 究 发 现 , 在 应 用 领域 , 构建 
损失 敏感 模型 的 结果 往往 优 于 其 它 方 法 (Liu & 
Zhou, 2006; McCarthy et aL, 2005), 该 方法 通过 设 
定 错误 分 类 的 损失 矩阵 使 模型 达到 最 优 预测 效果 
(Ting, 2002)。 本 研究 的 主要 目的 是 租 选 出 盖 性 学 生 ， 
因此 为 羞 导 样 本 的 错误 分 类 设 定 更 高 的 损失 ,并 对 
各 个 模型 进行 独立 调 参 ,使 模型 达到 最 优 的 分 类 结 
Ro 

最 后 , 综合 比较 各 模型 的 预测 结果 ,选择 最 优 
模型 进行 交叉 验证 。 交叉 验证 的 意义 在 于 规避 由 于 
单 次 抽取 的 训练 集 和 测试 集 导致 的 偏差 ， 该 方法 能 
够 对 模型 的 泛 化 能 力 进行 可 靠 的 估计 , 评估 模型 的 
稳定 性 (Hawkins et al., 2003)。 交 又 验 证 结果 较 好 ， 
表明 预测 模型 对 个 体 的 分 类 是 稳定 的 , 这 与 测量 信 
度 的 概念 较为 一 致 。 本 研究 采用 Geisser (1975) 提 出 
的 V 折 交叉 验证 方法 ,V 设置 为 5， 即 将 数据 平均 分 
为 5 tt, 每 次 以 其 中 1 份 作为 测试 集 ， 以 其 余 的 4 
份 作为 训练 集 ， 进行 多 次 验证 。 已 有 研究 结果 表明 
当 V 取 值 为 5~10 mf, 能 够 在 达到 验证 效果 稳定 性 
的 同时 , 保证 模型 计算 的 高 效 性 (Friedman et al., 
2001)。 


3 研究 结果 


3.1 教师 评分 与 学 生 自 评 的 相关 

预 研究 选择 华西 小 学 三 年 级 2 班 的 49 名 学 生 
作为 样本 ,收集 学 生 在 《 国 小 儿童 害 着 量 表 》 上 的 
自 评 结 果 以 及 班主 任 对 学 生 闫 层 水 平 的 评定 结果 。 
相关 分 析 显 示 ( 表 3), 教师 评分 与 学 生 自 评 之 间 相 
关 较 低 。 
3.2 “小学生 羞 性 量 表 修订 

首先 ,剔除 题 总 相关 小 于 0.2 的 3 道 题目 (5. 我 
会 主动 和 刚 认 识 的 人 说 话 ; 7. 在 班 上 ， 我 经 常 主动 
举 手 回答 问题 ; 27. 老 师 或 长 华 跟 我 说 话 的 时 候 ,， 我 
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表 3 教师 评分 与 学 生 自 评 的 相关 


il 教师 评分 - 教师 评分 - 教师 评分 - 教师 评分 - 
^ AA: WUA a A 总 分 


学 生 自 评 - 0.205 0.514 0.419 0.415 
EG 
学 生 自 评 - -0.170 0.213 —0.092 —0.008 
ZEAN 
学 生 自 评 - 0.067 0.332 0.084 0.181 
HEA 
学 生 自 评 - 0.058 0.421 0.161 0.239 
总 分 


TARIK) GH, WATE ee Ae ETT TEE AR 
Pr. Fe abo FARCE BO HT MC, XX 
部 分 题目 进行 精简 (例如 : 20. 我 和 不 熟悉 的 人 在 一 
起 的 时 候 ， 我 会 发 抖 或 心跳 加 速 ; 21. 如 果 我 和 很 多 
不 认识 的 人 在 一 起 ， 我 会 感到 身体 不 舒服 ; 22. 如 果 
陌生 人 跟 我 说 话 ， 我 会 心跳 加 快 ; 26. 如 果 我 和 不 就 
悉 的 人 在 一 起 ， 我 会 感到 紧张 不 安 )。 最 终 量 表 包 含 
19 道 题目 , 模型 拟 合 良 好 (x? = 898.599, df = 149, 
RMSEA = 0.04, CFI = 0.94, TLI = 0.94, SRMR = 
0.04). ZEITER, FERED RAE RE. BERRA 
度 以 及 量 表 整体 的 内 部 一 致 性 (Cronbach's a 系数 ) 
分 别 为 0.79、0.66、0.78 以 及 0.86。 
3.3 ”描述 统计 

根据 问卷 的 作答 结果 标定 样本 在 着 慎 行 为 、 差 
TEU KURZE: 4 — T HERE E p AR, 个 体 维度 总 
AY Z 分 数 大 于 Y AZAR BEY 2D Hs Qo ZED 1), 
其 余 个 体 为 普通 个 体 (标签 为 0),， 由 此 划分 出 6 组 
样本 ,各 组 样本 量 、 词 频 等 数据 如 表 4 所 示 。 


表 4 描述 统计 结果 汇总 
样本 ”最低 词 最 高 词 ”词汇 总 词汇 总 量 


RE PENS 
TUE FORE 比例 汇总 量 汇总 量 ， 量 均值 “标准 关 


FATA 
是 (1) 281 21.52% 62 353086 7338.62 21711.80 
否 (0) 1025 78.48% 78 292321 10114.79 31150.93 
ZEB 
是 (1) 176 13.48% 137 152657 605641 1270245 
T0) 1130 86.52% 62 353086 8227.89 25375.75 
HIRIRA 
是 (1) 217 16.62% 95 199348 7957.13 21606.92 
否 (0) 1089 83.38% 62 353086 7931.17 24538.95 


3.4 心理 词典 修订 
汇总 “ 教 客 学 伴 ” 上 所 有 学 生 的 文本 数据 ,使 用 


哈工大 社会 计算 与 信息 检索 研究 中 心 研 发 的 语言 
技术 平台 (LTP) 对 文本 进行 自动 分 词 , 统计 每 个 词 
出 现 的 频次 , 将 所 有 词 频 由 高 到 低 进 行 排序 , 并 且 
将 词 频 逐 个 累加 得 到 累计 词 频率 。 结 果 显 示 , 前 
6000 个 词 的 累积 词 频率 超过 90%， 此 后 每 再 增加 
1000 个 词 ， 累 积 词 频率 的 增 量 均 不 超过 1% (累积 
词 频率 和 累积 词 频率 增 量 见 图 1 图 2)。 因 此 , 保留 
前 6000 个 词 作 为 小 学 生 文本 的 高 频 词 。 将 6000 个 
高 频 词 与 原 词典 中 的 词汇 进行 比较 , 其 中 3119 个 
词 能 够 完全 匹配 ,其余 2881 个 词根 据 词 义 分 别 归 
入 118 个 词类 , 该 归 类 任务 由 两 名 心理 学 研究 生 协 
商 共 同 完成 。 扩 充 后 的 词典 详 见 https://xttian.oss- 


cn-beijing.aliyuncs.com/shyness dictionary. 
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图 2 小 学 生日 志文 本 累计 词 频 增 量 


3.5 ”特征 提取 
基于 修订 后 的 心理 词典 , Pe ES SCAR A 
普通 群体 文本 在 各 个 词类 上 的 词 频 。 采 用 卡 方 算 
法 ,以 卡 方 值 大 于 100 为 标准 ,挑选 出 在 两 类 群体 
文本 中 存在 明显 的 频率 差异 的 词类 。 2: TEE 
提取 23 Pie ERIE, ALTE MISES THER 16 个 词 频 
TAE, AAR A E 20 个 词 频 特征 。 将 特征 按 
“多 维度 共有 ”或 “单一 维度 特有 ”的 原则 整理 ,结果 
显示 : J) 每 句 平均 词 数 对 着 愤 行 为 、 盖 愤 认 知 和 着 
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学 dk 


性 情绪 均 有 负 向 预测 作用 ; 2): EZ: Br Fe iE 22 DA 
Al. At&T A VL 2 TE TS 28 25 HU 8 18] PURI E HT; 
3)28 I SCA IP BU e 28 AR RIS BEP, Hp, 
B — APRE BUNA, per 2 B A BUR E 9] RI E 
H, rep Ac PSA A ak DS frs 28 HUS 08 18] BUDU TE HT; 
4)Hi&i]. WHEW, Ur fein ^y IIS AE T 
RA IE SUPE, MX AENA TG i HU. 
负 向 的 预测 作用 ; SENE DRE P Fs RAE Ae EAT 
RARE IB BUE, m sESETSI DE 25 TET 25.48 9] oj 
的 负 向 预测 作用 ; 6) 感 知 历程 词 ， 尤 其 是 视觉 词 ， 
对 羞 尾行 为 具有 明显 的 正 向 预测 作用 ; 7) 生 理 历 程 
in], ERA, Wate tee AA Ae AY fi fe] fol 
测 作 用 。 


模型 的 预测 效果 ( 见 表 6) 发 现 ， 对 于 普通 群体 的 准 
确 率 , 各 模型 间 差异 不 大 , 均 在 0.8 AA; MFR 
尾 和 群体 的 准确 率 ， 随 机 森林 和 届 辑 斯 蒂 克 回归 的 表 
现 相 对 较 好 (0.15~0.50); 对 于 普通 群体 的 召回 率 
(BURR BE), DEFRA oe EIA A K 近邻 的 表现 相对 
较 好 (大 于 0.9); X TAERA TL 28 (BI ABER E), 
随机 森林 和 支持 向 量 机 的 表现 较 好 (0.15~0.44， 其 
中 情绪 维度 较 高 , 行为 和 认 知 维度 较 低 ); 对 于 总 
Fl 值 ， 随 机 和 森林 的 结果 表现 最 好 (0.55~0.57)。 
结果 还 表明 , 模型 对 普通 群体 预测 的 准确 率 和 
召回 率 比 较 高 ， 对 闫 愤 群 体 预测 的 准确 率 和 召回 率 
比较 低 ,， PETE REPRE ABR, 难以 从 大 群体 
中 识别 出 来 有 关 ， 虽然 在 原始 模型 中 增加 了 损失 敏 


各 维度 特征 及 卡 方 值 详 见 表 5。 感 函 数 来 提高 凑 愤 群体 的 预测 准确 率 , 但 是 提升 效 
3.6 ”模型 预测 果 有 限 。 


基于 筛选 后 的 特征 ,分 别 对 羞 导 行 为 、 羞 导 认 
知 、 状 愤 情 绪 建 立 预测 模型 。 本 研究 使 用 6 种 分 类 
模型 均 在 原始 模型 中 加 入 损失 敏感 函数 。 比 较 不 同 


整体 来 看 ， 随 机 森林 模型 在 本 研究 任务 中 的 表 
现 最 优 , 进而 对 该 模型 进行 交叉 验证 ,结果 见 表 T. 
结果 显示 ,总 Fl 的 稳定 性 非常 高 ， 取 值 在 0.52~0.57 


m5 各 维度 提取 特征 


AEN a UAI ape Ai 
词类 含义 方向 ”x*(1) 词类 * x 方向 pa) | 词类 含义 方向 xin 
C111 每 句 平均 词 数 - 534.36 | C111 每 句 平均 词 数 一 。 534.36 | Clll 每 句 平均 词 数 = 53436 
C33 ”社会 历程 词 — 159.70 | C33 ”社会 历程 词 = 579.58 | C33 ”社会 历程 词 — 293.28 
C34 ”家 人 词 - 377.82 | C34 家 人 词 一 。 274.53 | C34 ZA - 236.62 
C28 语词 +  14682|C28 口语 词 - 300.67 | C28 口语 词 — 131.76 
C32 Nis + 143.77] C32 填充 歼 词 一  33144| C32 HEA — 100.69 
C67 ” 知 历程 词 + ”421.76 C67 认 知 历程 词 - 30168] C67 认 知 历程 词 — 270.85 
nm C5 ”第 一 人 称 复数 代名词 + ”152.95 C5 第 一 人 称 复数 代名词  -  40614|C3 特定 人 称 代 名 词  - 13293 
Z C6 ”第 二 人 称 代名词 - 2734|c2 ”代名词 -  35697|C74 UA - 225.94 
C31 停顿 更 词 +  16320|C3 特定 人 称 代名词 = 。 334.49 | C69 KR + 112.08 
C72 ”确切 词 + 20460] C74 包含 词 = 121.67 | Cl ”功能 词 — 270.38 
C75 ”排除 词 +  14494| C75 ”排除 词 - 243.00 C22 is Bhi — 116.55 
C69 ”因果 词 + 228.00] C15 连接 词 = 126.65 | C11 ”动词 — 334.79 
Cl ”功能 词 + 359.20] C90 成 就 词 + 118.25 | C91 ”休闲 词 - 27143 
CI3 ”副词 + 315.86] C85 ”相对 词 + 104.50 | C23 ”时 态 标定 词 — 319.35 
C15 ”连接 词 +  57402|C87 空间 词 + 226.83 || C27 延续 = 33447 
C91 ”休闲 词 -  30710| C94 宗教 词 一 332.24] C85 ”相对 词 - 424.11 
cos ”动物 词 — 471.33 C88 ”时 间 词 -= 174.19 
C24 wk + 113.93 C86 ”移动 词 — 367.58 
C89 TH + 270.43 C80 ”生理 历程 词 - 111.72 
C76 ”感知 历程 词 — 340.46 C84 RAH — 126.11 
C77 ”视觉 词 - 309.74 
C78 ”听觉 词 - 204.74 
C94 ”宗教 词 + 139.86 
DE: + 表示 该 特征 在 羞 愤 群 体 文本 中 出 现 的 频率 更 高 , -表示 在 普通 群体 文本 中 出 现 的 频率 更 高 。 
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表 6 模型 预测 结果 
TU - coca : REPERI nes Ve g ET ane SENTURTE 

行为 认 知 情绪 行为 WO 情绪 行为 认 知 情绪 行为 认 知 情绪 行为 认 知 情绪 行为 认 知 情绪 
准确 率 - 普 通 0.86 0.78 0.85 0.88 0.84 0.87 0.86 0.80 0.84 0.85 0.79 0.84 0.83 0.81 0.85 0.84 0.82 0.87 
MEW(Ss—2$B: 0.16 0.16 0.18 0.29 0.25 0.20 0.50 0.27 0.15 0.00 0.14 0.20 0.10 0.27 0.16 0.11 0.28 0.23 
召回 率 - 普 通 0.86 0.75 0.82 0.86 0.93 0.68 0.99 0.92 0.90 0.99 0.94 0.98 0.63 0.89 0.67 0.75 0.78 0.74 
Hi3&-2$H; 0.16 0.19 0.22 0.29 0.15 0.44 0.05 0.11 0.10 0.00 0.04 0.02 0.24 0.17 0.34 0.18 0.34 0.42 
F1 值 -普通 ^ 0.86 0.77 0.83 0.89 0.67 0.76 0.92 0.86 0.87 0.00 0.86 0.91 0.71 0.85 0.75 0.79 0.80 0.80 
Fl[fl-2:fk ^ 0.16 0.17 0.20 0.28 0.34 0.28 0.10 0.16 0.12 0.00 0.06 0.04 0.14 0.21 0.22 0.14 0.31 0.29 
总 Fl fi 0.51 0.47 0.52 0.57 0.56 0.55 0.59 0.53 0.50 0.46 0.48 0.51 0.45 0.53 0.51 0.47 0.56 0.56 

表 7 随机 森林 模型 交叉 验证 结果 
第 一 次 第 二 次 第 三 次 第 四 次 第 五 次 
维度 

行为 ” 认 知 ”情绪 ”行为 ” 认 知 ”人 情绪 ”行为 认 知 ”情绪 行为” 认 知 ”情绪 行为” 认 知 情绪 
准确 率 -普通 0.88 0.81 0.87 0.85 0.75 0.86 0.89 0.78 0.86 0.88 0.83 0.86 0.89 0.79 0.85 
WEK- 0.26 0.35 0.20 0.20 0.43 0.26 0.18 0.27 020 0.19 0.33 0.19 0.22 0.29 0.18 
召回 率 - 普 通 0.86 0.93 0.68 0.87 0.96 0.76 0.7 0.87 0.77 0.73 0.85 0.69 0.74 0.82 0.62 
BEHR- 0.29 0.15 0.44 0.17 0.09 04 0.43 0.17 0.33 0.39 (029 0.39 0.44 025 044 
F1 值 -普通 0.87 0.87 0.76 0.86 0.84 0.81 0.78 0.82 0.81 0.80 0.84 0.77 0.81 0.80 0.72 
Fl [HE 0.27 0.21 0.28 0.18 0.15 0.32 0.25 0.21 0.25 0.26 0.31 0.26 029 0.27 026 
总 Fl 值 0.57 0.56 0.55 0.52 0.56 0.57 0.55 0.52 054 0.55 0.57  Á 0.53 0.57 0.54 0.52 


之 间 。 普 通 群 体 的 准确 率 和 召回 率 都 比较 稳定 ， 波 
动 最 大 不 超过 0.17， 大 部 分 的 波动 都 不 超过 0.1.28 
改 群体 的 稳定 性 相对 差 一 些 , 波动 最 大 为 0.27, 大 
部 分 波动 都 不 超过 0.15。 


4 讨论 


AH FE A TETRA AE NE ATR UA, KIE 
FEE RE AAS 3538 BEDS B TAIL A 2858, 因此 预先 采 
FAR Tr ITAR, FE T E a 5g 
特征 来 构建 预测 模型 。 与 此 相反 ， 有 一 些 研究 以 模 
型 准确 率 为 主要 目标 , 不 强调 模型 结果 的 解释 性 ， 
采用 神经 网 络 等 更 加 复杂 的 深度 模型 处 理 高 维特 
WE, tit NEAT PIE PECAN, Xue et aL, 2018), 采用 
该 方式 建 模 虽然 预测 精度 较 高 , 但 是 并 不 能 够 对 预 
测 群体 的 语言 风格 进行 直观 的 描述 和 解释。 因而 ， 
采用 卡 方 算法 预先 提取 特征 再 构建 预测 模型 更 符 
合 本 研究 的 目标 。 下 面 分 别 从 闫 层 群 体 的 词汇 使 
用 的 共性 和 差异 性 以 及 差 层 预 测 模型 的 精度 展开 
讨论 。 

41 羞 层 各 维度 的 文本 表现 既 有 共性 也 有 特性 

本 人 研究 基于 真实 的 小 学 生 文 本 对 “ 文 心 词典 ” 
进行 扩充 , 构建 出 适用 于 儿童 的 心理 词典 , 实现 更 
为 精准 的 特征 提取 ,并 通过 卡 方 检验 对 词 频 特征 进 


sS 


FTE. ZhiR gon, Bet HE AS A a AE AE A ad E. 
确实 存在 明显 差异 。 部 分 特征 为 多 个 维度 所 共有 ， 
ÆTI, Ae AAI A a TEE 2 ET E 
点 ; 同时 也 存在 某 些 特征 为 单一 维度 所 有 ， 能 够 充 
分 体现 出 该 维度 的 特点 。 

HIRITA, HENA Be Fe ENG AY CAISSE I 
的 共性 主要 体现 在 “每 句 平 均 词 数 ” 以 及 “社会 历程 
词 * 两 方面 : 首先 , BARITA, ATED AIL Rei 
闫 愤 情 绪 个 体 的 文本 中 ,每 句 平均 词 数 均 小 于 普通 
个 体 文 本 ， 这 与 着 伟 个体 说 话 少 、 回 答 较 短 、 表 达 
不 流利 等 行为 模式 有 直接 关系 。 已 有 研究 显示 ， 高 
内 倾 性 个 体 的 每 句 平均 词 数 比 外 倾 性 个 体 更 少 
(Mehl et al., 2006), Ii Ze tS hy ELF A Nn BEE AN 
[Bi E AAR (Lawrence & Bennett, 1992), FL ik [AB] 
MA ZEAE BGR (AG SH, 2011). AI, ZETA AN 
的 语言 风格 与 高 内 倾 性 个 体 相 近 , 在 文本 中 体现 为 
使 用 更 短 的 句子 ; 其 次 , BARNUM, Bate A 
以 及 高 着 愤 情 绪 个 体 的 文本 中 ,社会 历程 词 均 较 
少 。 已 有 研究 显示 ， 高 外 倾 性 的 个 体 文本 中 的 社会 
性 词汇 更 多 (Gill et al., 2009; Mehl et al., 2006), 
此 ， 较 少 的 社会 历程 词 进一步 体现 出 着 导 个 体 的 内 
倾 性 。 社 会 历程 词 对 着 导 的 负 向 预测 作用 主要 体现 
在 家 人 词 这 一 子 类 ,高 盖 导 个 体 的 文本 中 更 少 提 及 


FT 
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家 人 词 。 已 有 研究 显示 ,儿童 期 着 导 与 亲子 关系 、 
父母 的 社交 能 力 等 均 有 关系 (Arroyo et al., 2012; 
Huang, 1999), Æ Hk JL SE BJ AC EE TE HOME JL 38 E A AY 
需求 不 敏感 ， 且 更 倾向 于 采用 强硬 的 策略 (Engfer 
1993)， 探 制 型 或 过 度 保 护 型 的 家 庭 涉及 频繁 的 矫 
TEMA, ui np DELE et (Bruch, 1989). 
此 ,尽管 家 人 词 是 小 学 生 文本 中 的 高 频 词 , {AE 
学 生 文本 中 这 类 词 相对 更 少 ， 反映 出 家 庭 环境 对 着 
性 特质 发 展 的 影响 。 

已 有 研究 者 认为 ， 羞 导 的 内 在 认 知 及 情绪 体验 
应 当 与 其 外 在 行为 表现 区 分 (Leary，1986)。 本 人 研究 
TREE A. RESCUE aE 4. — PE HE PS E 
取 特 征 ， 28 on, ARTETA ESC AS #2 LE Wh 28 
TED AIAN AAP ERE WE PSG, TE 
TAZA A es 26:1: T8 28 B AS E3411 SEB — 
AIRE BAC Te, df es AET DT PRI SCS HIE 
WERE, AY fE I HE A: DAE RE Tp R 
(Coplan et al.，2004)， 即 高 社交 趋向 动机 和 高 社交 
回避 动机 的 组 合 ， 尽管 着 导 个 体感 到 社交 焦虑 和 压 
力 , 但 同样 期 望 进行 社交 活动 以 维持 自尊 水 平 
(Dennissen et al., 2008); 其 次 ， 口 语词 (包含 填充 化 
词 等 )、 功 能 词 (包括 连接 词 等 )、 认 知 历程 词 (包含 
因果 词 、 包 含 词 HERWIN AET ARA E e 
Tul EFA, mer Ae LAURI ZEE TE 5 EUR 15 p] FD 
作用 。 已 有 研究 显示 , 较 多 的 填充 歼 词 反映 出 个 体 
更 多 地 考虑 他 人 和 环境 ， 即 对 他 人 接受 自己 所 表达 
内 容 的 期 待 (Laserna et al., 2014)。 上 述 特征 提取 结 
Fe SCR Aa tA AEE AE. Fb, ARTE AT A 
往往 受到 外 部 限制 , 具有 较 高 的 情境 性 (Henderson 
et al., 2014), 在 写作 文本 中 的 特征 体现 可 能 不 明显 。 

时 间 词 包含 过 去 、 现 在 、 未 来 以 及 延续 四 个 子 
类 ,其 中 过 去 词 对 羞 层 行 为 具有 明显 的 正 向 预测 作 
用 ， 而 延续 词 则 对 郑 导 情 绪 有 明显 的 负 回 预测 作 
Ho CLA RIE ZEA, FR PETE AEE AE EIR FRA 
知 、 低 自尊 等 问题 (Caspi et al., 1988; Dennissen et 
al.，2008)。 黄 希 庭 和 郑 涌 (2000) 研 究 发 现 ， 高 自我 
认同 个 体 有 更 大 的 现在 广度 ,更 积极 的 未 来 取 癌 ， 
而 低 自 我 认同 个 体 则 有 更 强 的 过 去 取向 ， 且 与 未 来 
中 断 的 现象 更 易 发 生 。 低 自我 认同 者 往往 对 现实 感 
AMEMA, RRRA E, 因此 转向 过 去 。 
此 ， 较 多 过 去 词 、 较 少 延续 词 的 现象 可 能 反映 出 状 
性 个 体 的 自我 意识 发 展 问题 。 

感知 历程 词 对 着 导 行 为 具有 明显 的 正 向 预测 
作用 , 尤其 体现 在 视觉 词 ， 这 一 结果 与 量 表 中 的 相 


关 项 目 ( 如 “我 觉得 别人 在 注意 我 ”) 相 吻合 。 人 研究 者 
普遍 认为 ， 闭 慎 包 含 个 体 对 他 人 如 何 看 待 和 评估 自 
己 的 担忧 ， 当 个 体 关注 他 人 对 自己 的 印象 时 , 往往 
Se Wot EE AY A SK FZ (Leary & Schlenker, 1981; 
Leary, 1983; Schlenker & Leary, 1982)， 较 多 的 感知 
py fis] A9 h es 28 H1 O8 P AE HE HE TR PURSE 
Mage SHE. BET, FEST boh 28 S Wt) 
过 度 自 我 中 心 以 及 过 度 关 注 社会 评价 的 特点 
(Zimbardo, 1982)。 

生理 历程 词 对 羞 导 情绪 具有 明显 的 负 向 预测 
作用 , 尤其 体现 在 摄食 词 。 基 于 新 浪 微 博 的 研究 结 
果 显 示 , 摄取 词 与 神经 质 呈 显著 正 相 关 (Gu et al., 
2018)， 而 着 愤 与 神经 质 也 显著 相关 (Hofstee et al., 
1992; Jones et al., 2014; Kwiatkowska et al., 2019; 
La Sala et al., 2014; Sato et al., 2018)。 进食 障碍 个 体 
往往 存在 社会 依赖 与 自主 的 趋 避 冲 突 , 渴望 保持 独 
立 的 同时 也 依赖 人 际 关系 以 维持 自尊 (Narduzzi & 
Jackson，2000)， 并 且 存 在 对 错误 的 过 度 关 注 和 对 
自我 表现 的 焦虑 (Cassin & von Ranson, 2005)， 这 些 
PIES AEP AE o 
4.2 ”基于 文本 特征 构建 分 类 模型 能 够 预测 小 学 

Æ Blk 

基于 卡 方 算法 识别 重要 的 词 频 特 征 ， 据 此 构建 
分 类 预测 模型 并 计算 模型 的 各 个 精度 指标 ,在 识别 
重要 特征 组 合 的 同时 , 保证 了 模型 的 预测 效果 。 结 
果 显 示 ， 随 机 森林 在 三 个 维度 的 表现 较为 均衡 。 已 
有 研究 中 ， 同 样 有 研究 者 采用 随机 森林 在 人 格 预 
测 、 心 理 问题 盘查 等 任务 中 达到 最 优 效 果 (Chen et 
al., 2017; Kwiatkowska et al., 2019; Papamitsiou & 
Economides, 2017; Skowron et al, 2016). 

FH T BLA, et AS A Er XT 26 A AR 9] SCS d Si T 
究 ， 因此 将 已 有 的 人 格 预测 研究 结果 与 本 研究 对 比 
分 析 。 已 有 基于 LIWC 提取 特征 预测 Facebook 用 
户 的 大 五 人 格 的 研究 中 , 模型 最 终 准 确 率 、 召 回 率 


以 及 F1 值 往往 在 45%~65% 范 围 内 (如 , Farnadi et al., 


2013; Marouf et al., 2019), 本 人 研究 结果 接近 已 有 研 
BEER, 显示 出 基于 在 线 写 作文 本 预测 小 学 生 闫 层 
特质 的 可 行 性 ,尤其 是 模型 的 特异 度 很 高 (大 于 
0.9)， 说 明 对 普通 群体 的 误 判 非常 小 。 盖 导 情 绪 维 
度 的 敏感 度 在 0.4 左右 ， 其 它 两 个 维度 在 0.2 左右 ， 
这 个 结果 并 不 理想 ,这 主要 是 由 于 本 人 研究 的 主要 目 
标 为 探索 小 学 生 羞 导 在 词汇 层面 的 表现 ， 模 型 仅 纳 
入 词 频 特 征 ,未 采用 对 语言 风格 不 具有 可 解释 性 的 
文本 向 量化 表征 方式 ， 因 此 预测 力 有 限 。 已 有 人 研究 
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显示 , 采用 多 元 类 型 的 特征 (如 用 户 的 在 线 社交 网 
络 ) 以 及 深度 学 习 模 型 , 能够 明显 提高 预测 效果 
(Aung & Myint, 2019; Farnadi et al., 2013; Tandera 
et al., 2017), HIE &, Farnadi 等 人 (2013) 在 词汇 特征 
的 基础 上 加 入 社交 网 络 特征 , 模型 的 预测 准确 率 从 
54% 提 升 至 71%。 因 此 , 未 来 将 尝试 在 已 有 发 现 的 
基础 上 ,结合 学 生 的 在 线 行为 数据 等 特征 ,构建 更 
加 复杂 且 具 有 良好 解释 性 的 模型 。 此 外 ， 状 层 群 体 
的 准确 率 和 召回 率 不 高 ， 而 且 交 又 验证 的 结果 也 显 
示 闫 导 群 体 的 稳定 性 相对 差 一 些 , 这 一 情况 主要 是 
受到 了 样本 类 别 分 布 不 均衡 的 影响 (Diamantidis et 
al., 2000; Oommen et al., 2011), 未 来 将 持续 收集 文 
本 数据 ,扩充 文本 数据 库 , 提升 模型 的 预测 效果 。 

目前 , 学 生 在 教学 平台 上 学 习 并 在 线 完成 作业 
和 任务 逐渐 成 为 常态 ,未 来 必 将 产生 更 大 量 级 的 数 
据 ， 为 研究 者 基于 文本 挖掘 学 生 心 理 品质 提供 丰富 
的 原始 语 料 。 心 理学 研究 应 当 充 分 发 挥 这 一 数据 资 
产 的 价值 , 来 挖掘 和 揭示 心理 特点 和 规律 。 本 研究 
旨 在 探索 基于 在 线 教 学 平台 上 的 文本 数据 来 揭示 
和 预测 心理 特质 的 新 方法 ， 期 望 为 未 来 更 多 相关 研 
究 的 开展 提供 参考 。 


5 结论 


本 研究 尝试 利用 文本 挖掘 技术 对 小 学 生 在 线 
写作 文本 进行 分 析 , 挖掘 闭 导 特质 的 词汇 特征 , 构 
建 小 学 生 羞 居 特 质 的 语言 风格 模型 并 实现 自动 预 
测 。 本 研究 的 主要 结果 如 下 : 

(1) 基 于 真实 的 小 学 生 文 本 对 “ 文 心 词 典 ” 进 行 
扩充 , 构建 出 适用 于 儿童 的 心理 词典 , 实现 更 为 精 
准 的 特征 提取 ， 并 利用 卡 方 算法 筛选 文本 特征 ， 构 
HE iW ee TARY oe BRI EHE RE TR. XUL, Pal] HS ZETA 
在 行为 、 认 知 及 情绪 上 的 文本 表现 的 共性 和 差异 ; 
CO) 基 于 筛选 后 的 词典 特征 建立 多 种 预测 模型 ， 显 
示 出 机 需 学 习 模型 在 检测 小 学 生 羞 导 特 质 上 的 有 
效 性 。 

本 研究 揭示 了 小 学 生 羞 愤 行 为 、 羞 愤 认 知 和 善 
层 情 绪 的 语言 风格 和 词汇 使 用 特点 ,为 研究 者 更 加 
深入 地 了 解 差 层 个 体 提供 建议 和 启发 。 同 时 ， 本 研 
究 采 用 词汇 特征 构建 多 种 机 器 学 习 模型 ， 为 未 来 采 
用 更 丰富 的 特征 以 及 深度 学 习 模 型 预测 状 层 提 供 
了 基础 。 
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Abstract 

The present study aimed to explore a new method of measuring shyness based on 1306 elementary school 
students' online writing texts. A supervised learning method was used to map students' labels (tagged by their 
results of scale) with their text features (extracted from online writing texts based on a psychological dictionary) 
to build a machine learning model. Key feature sets for different dimensions of shyness were built and a 
machine learning model was constructed based on the selected feature to achieve automatic prediction. 

The labels were obtained through “National School Children Shyness Scale" completed online by 
elementary students. The scale includes three dimensions of shyness: shy behavior, shy cognition and shy 
emotion. Students with Z-scores of each dimension over 1 were labeled as shy and others were labeled as normal. 
Students’ online writing texts were collected from "TeachGrid" (https://www.jiaokee.com/), an online learning 
platform wherein students writing texts. 

The dictionary applied in the present study was Textmind, a widely used Chinese psychological dictionary 
developed based on Linguistic Inquiry and Word Count (LIWC). The dictionary was compiled mainly based on 
the corpus of adults. To ensure the validity of extracted features, we modified the original dictionary by 
expanding the categories and vocabulary with the real writing text of elementary students. The revised 
dictionary contained 118 categories. 

Features were extracted based on the revised dictionary. Chi-square algorithm was applied to identify the 
features that can distinguish between shy and normal groups to the greatest extent. Three sets of key features 
confirmed a significant lexical difference between shy and normal individuals. Among the selected features, 
some were shared by multiple dimensions reflecting the universal textual expression of shy individuals (e.g., 
The average number of words per sentence and the frequency of social words of shy individuals were less than 
that of normal counterparts.), and there were certain features reflected the unique characteristics of certain 
dimension (Perception words predicted shy behavior reflecting that high shy behavior individuals frequently felt 
being watched). 

Based on the selected features, Python 3.6.2 was used to construct the six prediction modes: Decision Tree, 
Random Forest, Support Vector Machine, Logistic Stitch Regression, K-Nearest Neighbor and Multilayer 
Perceptron. Overall, random forests have achieved the best results in the present study. The F1 score was 0.582, 
0.552 and 0.545 for behavior cognition and emotion showing the feasibility of automatically predicting shyness 
characteristics of elementary school students based on textual language. The implication of word embedding, 
and deep learning models would improve the final prediction. 

Key words shyness, online writing, psychological dictionary, text mining, language style model 


